
2020 13篇文章
09-08 Getting Started with gym #强化学习 RL #gym 09-08 强化学习:控制工程师帮你醍醐灌顶 #强化学习 RL #Matlab 09-03 RL实践2——RL环境gym搭建 #强化学习 RL #gym 09-03 RL实践3——为Agent添加Policy、记忆功能 #强化学习 RL #Sarsa 08-27 强化学习笔记10:经典游戏示例 classic games #强化学习 RL #经典游戏示例 08-23 强化学习笔记9:探索和利用 exploration and exploitation #强化学习 RL #探索 exploration #利用 exploitation 08-17 强化学习笔记8:整合学习和规划 #强化学习 RL #学习 Learning #规划 Planning 08-11 强化学习笔记7:策略梯度 Policy Gradient #强化学习 RL #策略梯度 Policy gradient 08-05 强化学习笔记6:值函数估计Value function Approximation #强化学习 RL #值函数估计 value function approximation 08-01 强化学习笔记5:无模型控制 Model-free control #强化学习 RL #无模型控制 model-free control 07-15 强化学习笔记4:无模型预测 model-free prediction #强化学习 RL #无模型预测 model-free prediction 07-10 强化学习笔记3:动态规划 planning by dynamic programming(DP) #强化学习 RL #动态规划 dynamic programming 07-05 强化学习笔记2:马尔科夫决策过程Markov decision process(MDP) #强化学习 RL #马尔科夫决策过程 MDP